python怎么自动批量读取文件夹下的excel?
Python批量读取特定文件夹下Excel的话,主要分为2步,首先根据后缀名(xls或xlsx)匹配出所有Excel文件,然后直接利用相关模块(pandas,openpyxl等)读取即可,下面我简单介绍一下实现过程,感兴趣的朋友可以尝试一下:
查找所有Excel文件
这一步非常简单,主要是根据后缀名匹配所有Excel文件,基本思路先使用os.walk函数遍历指定的文件夹,找到所有文件,然后一一匹配文件后缀名,如果是xls或xlsx,则为Excel文件,添加到list列表,之后返回,后面读取函数就是根据这个列表(存储所有搜索到的Excel文件路径)读取Excel文件:
读取Excel文件内容
这一步主要你是根据上一步找到的Excel文件路径直接读取Excel文件,至于读取模块或库的话,那就非常多啦,基本的xlrd,xlutils,openpyxl都行,简单的方式就是使用pandas,一个著名的数据处理库,内置了大量函数和类型,可以轻松处理Excel等日常各种文件,安装的话,直接在cmd窗口输入命令“pip install pandas”即可:
安装完成后,我们就可以直接使用pandas库读取Excel文件了,非常简单,只需要一行代码即可搞定,也就是read_excel函数,传入Excel文件路径就行,默认情况下会读取列标题,如果你不需要列标题的话,设置header=None即可,读取的数据类型为DataFrame,后续处理的话,也非常方便: